Talk to the City勉強会
口頭の質疑を加筆したいが、忙しくて遅れてる
今までの振り替えり
https://pbs.twimg.com/media/GO39erpaEAAGVXM?format=jpg&name=medium#.png
今回のメインはこのTalk to the City(TTTC)の話
時事の話
これまでの選挙期間は「候補者の意見をブロードキャストする」、つまり候補者の考えていることを一方的に有権者に伝える時間でした。私は今回、テクノロジーを使うことで人々の意見を聞く期間にできると考えています。これをデジタル民主主義の世界では「ブロードリスニング」と呼びます。このブロードリスニングを通じて、選挙期間をみんなで理想の政策を考えるための時間にしたいと思います。 そして
これらのキャンペーンに使ったプログラムは、すべて選挙後にオープンソースで公開する予定 ”安野さんのブロードリスニング、マイナンバーシステム、オープンソース精神を組み合わせたやり方を私は気に入っています”
”安野さんは抗議活動をしているのではない。私はそこがすごく好きだ。彼は『私たちは良い方向に変われる』と言っているのだ”
感想
ブロードリスニングの概念を知ったとき、これは生身の人間に不可能なレベルの「多勢の意見を聞くこと」を可能にする技術だと思った。
今後のLLMの発展で実現コストが下がっていって、数年で「手軽に使える技術」になり、5年10年後にはサイボウズのようなグループウェア企業にとって無視できない技術になるだろう
〜ぐらいのタイムスパンで考えてたのて、1年でここまで来るとは、世界の変化の加速が激しい!という感じ
手伝ってます!
https://gyazo.com/8aed1a6ee239c672d1e504cdb48d0e9e
解説
情報を複製し配信する技術の発展により、一人の人が大勢の人に考えを伝えることが容易になった。
しかし大勢が情報発信すると、一人が受け取る情報量が膨大になり情報洪水で溺れてしまう。
人々が積極的に発信する社会や会社では、大勢の意見を聞くことを支援する技術が重要になる。
技術的な話
これは広い意味では「要約」の一種
だがLLMの学習において「要約タスク」は、論文の本文を入れてアブストラクト部分を出すなどの学習データで訓練されている
これは「一人の人が書いた整った文章」を入力として想定している
「大勢の人がそれぞれ書いた文章集合」の要約技術が必要になる
それをどうやるかの試行錯誤が行われつつある
余談
https://gyazo.com/6ba0de3971710aa53717ccf0cee66be9
https://gyazo.com/48c12e0903a8841a6eb3b512bd451ce5
綺麗なスライドに突如出てくる僕の手書きの図www いいのか?ww (誰か綺麗にしたバージョンをCC0とかで作ってくれないかなw)
(なお関さんにはScrapboxにある画像を好きに使っていいよと許諾してある)
https://gyazo.com/c482df2fe3d92e75422add645a647d78
文章に対する「賛成(+1)」「反対(-1)」「わからない/中立(0)」が意見ベクトルとなる
このベクトルがクラスタリングされ、クラスタを分ける要因になった文章などが表示される
実際にやってみたもの
https://gyazo.com/cd1644cee2b1fc42b56518d6e65d55ec
合法化に対する賛成(73%)よりも賛成割合の高い文章が見つかった
例: 社会的証明としての婚姻と、税制・社会保障としての婚姻は別のレイヤーでそれぞれ検討されるべき課題がある。: 賛成74%、反対11%、中立13%
同性婚反対の人の多いクラスタAで86%、賛成ばかりのクラスタBで69%が賛成している、どちらも過半数
つまり、この「同性婚賛成反対」という対立を解消するためには、まず双方が合意している「社会的証明と、財政社会保障とを分離しましょう」路線を進めて行くのが良さそう、とわかる
同性婚の反対者が、同性婚自体に反対してるのではなく、たとえば「息子が男性と結婚して息子が幸せになるなら、それは認めて良い」「だけど、その『息子の配偶者男性』はよくわからんので家族の一員にするのには抵抗あるなー」という気持ちの人が多いのだということが明らかになった
可視化と分析によって、対立構図を別の切り口から観察できるようになる
vTaiwanは、台湾の政府が市民参加を促進するために設立したオンラインプラットフォーム
主に公共政策や法案について市民からの意見を収集し、討論を行う場として利用されている
2015年のものなのでLLMなどのAI的な機能はない
基本は文章に対して賛成反対を投票するもの
文章自体も投稿できるように設定できる
だが、文章が多くなりすぎて投票する人が疲れるとか、似た内容の文章だらけになるとか、文章の意味がわからないとかの問題が発生する
Talk to the Cityとは
Audrey Tang(要約): 2014年には、多くの人々の意見を集めて、全ての微妙なニュアンスを保持することは不可能でしたが、現在では「Talk to the City」というツールのおかげで、それが非常に簡単かつ安価にできるようになりました。
特に都市などコミュニティとの対話を促進するために設計された
TwitterのツイートやPolisの結果などを収集し、それを分析する
意見や議論のクラスターを可視化し、クラスターごとの解説を生成する
これによって人々がコメント分布の全体像を把握することを助け、建設的な対話を促進する
Talk to the Cityの技術的仕組み
Polisと違って入力はテキストデータ
なのでテキストデータがあるなら何にでも使える
Polisに限らず、Twitter、Google Form、ニュース記事のコメント欄、グループウェアなど、多様なデータソースを活用できる
突飛な実験として書籍の各段落を入れてみた:
有用かどうかはさておき技術的には可能
入力テキストに対してLLMを使って簡潔で読みやすいメッセージを抽出する
JSONリスト形式で取得するので、1つの入力に対して複数のメッセージが抽出されることもある
デフォルトだとGPT-3.5-turboにFew-shotsで例示している
まずドキュメントを言語モデルで高次元ベクトルに埋め込む
UMAP(Uniform Manifold Approximation and Projection)で低次元空間に投影 HDBSCAN(Hierarchical Density-Based Spatial Clustering of Applications with Noise)で階層クラスタリング UMAPで2次元空間に落として視覚化
クラスタをドキュメントとみなしたTF-IDFで、そのクラスタを特徴づけるキーワードを特定する
LLMがクラスタの解説を生成する
実際に見てみよう
2024-06-12 第一弾が公開された!
私に対する関心やご懸念がどこにあるのか、より具体的なイメージが湧いてきました。データやAIも活用しながら、都民のみなさまのお考えや想いに向き合ってまいります!
takahiroanno テクノロジーを使うことで人々の意見を聞くことを、デジタル民主主義の世界では「ブロードリスニング」と呼びます。その具体例として、まずはこちらの分析レポートを作成しました。今後さらにアップデートし、みなさまの意見に耳を傾けていきます! https://gyazo.com/8d2af6ecf7cbfb9190301b04f4ef88b4
Polis 2.0
Audrey Tangが提唱したアイデア
公式な発表などはされてない開発コードネームみたいなもの
PolisのデータからTTTCでクラスタを作る
そのクラスタから生成された仮想的意見リーダーとチャットをできるようにする
https://gyazo.com/f4340548f38ff6bc2c43958a01d63a39
https://gyazo.com/70ef859c94406820a5a8a4da5b6a3c5e
多くの参加者にとって、熟議という文脈でAIと対話するのは初めてのことです。 つまり、一人でAIと話すのではなく、みんなの利益のためにグループで議論するのです。
このような増強された熟議によって、誰もがデジタル民主主義に貢献できる、そしてデジタル民主主義の恩恵を受けることができるのです。
増強された熟議は、社会のレジリエンス(困難を乗り越える力)を高めます。 異文化に対する理解と共感を深め、情報が整合性をもって統合されるからです。
この「増強された熟議」は僕の関心事である知的生産性の向上の観点からもとても面白い
が、あんまり盛り上がってない
その理由はおそらく
話し相手がキャラクター性のない「クラスター」という状況に人が慣れていない
こういう形のコミュニケーションに不慣れなので、まずは他人がやってるところを見たい
他人のやり取りを見れるようにしてもある程度の人数が集まらないと他人に出会えない
その観点から安野さんの施策を見ると面白い
「VTuberと視聴者のやり取り」という既にあるコミュニケーション形式を使っている
視聴者はまず他人がやり取りしているのを視聴するところから始められるし、YouTubeの機能としてアーカイブが残る
都知事選の候補というキャラ立ち
都知事選の候補という観点では
生身の人間は1日24時間の一部の時間しか使えない
駅前に立ったりすることで、そこに物理的に来ることができた有権者とコミュニケーションする
コミュニケーションの内容は雲散霧消する
デジタルの人間(仮想的人格)は24時間活動し続けられる
YouTubeの特定のチャンネルにずっといて、世界中どこからでもアクセスしてコミュニケーションできる
コミュニケーションの内容は保存される。
つまりYouTube Liveに寄せられたコメントをTTTCの分析対象にできる
うまいこと考えたなーと思っている
1対1のコミュニケーションでは「一方的に喋るのではなく相手の話を聞きましょう」「口は一つ、耳は二つなのだから2倍聞くつもりでいましょう」みたいなことを言う
しかし従来のテレビや新聞ではなどでのマスコミュニケーションでは、一方的に発信されたものを、たくさんの視聴者が受信するだけであった
なぜそうなったのかというと、情報を複製して大勢に届ける技術の方が、情報を要約する技術よりも早く発展したから
https://gyazo.com/8aed1a6ee239c672d1e504cdb48d0e9e
いろいろな技術がいろいろな速度で普及したので一概には言いにくいがドイツの国民ラジオが1939年に70%の国民に普及したのが一つの例 この100年の間に、一方向的マスコミュニケーションに慣らされた視聴者は「自分が話してもいいんだ」「聞いてくれる人がいるんだ」という自信を持ちにくくなってしまった まず「聞く姿勢」を打ち出してコメントを集め、それを可視化して「みなさんの声を聞いた結果、こうなった」と示し、それを見た人々の認識がアップデートされて、よりよいコメントを書いて……というサイクルを回していくことによって、より良い「双方向的マスコミュニケーション」が実現していく https://gyazo.com/c993101b5fb2bc34d642d7f880a9ad7a
gpt.iconフィードバックループの形成により、シード意見の自動生成とPolisデータベースの拡張が可能になる
表現の仕方はさまざまだが「繰り返しサイクルを回していくことによってマスコミュニケーションを双方向化していこう」とい方向性が世界のあちこちで模索されている
アップロードの帯域を増やしていくことが大事
転がりながらだんだん大きくなっていく雪玉のイメージ まとめ
デジタル民主主義を掲げる安野たかひろ氏の東京都知事選キャンペーンは、ブロードリスニングの概念を活用し、多くの有権者の声に耳を傾けることを目指している。 YouTubeを活用した双方向のコミュニケーション戦略は、従来の一方的なマスコミュニケーションを変革する可能性を秘めている。
このキャンペーンは日本におけるブロードリスニングの知名度を高め、それを重要だと考える有権者が多いことが示されれば、他の政治家もブロードリスニングを取り入れていくだろう。
PolisとTalk to the Cityはどちらもコピーレフトなオープンソース(AGPL)のツールであり、利用者が増えるほど洗練されていく。
技術の発展によって、大勢の意見を効率的に集約し、建設的な対話を促進することが可能になる。
こうした取り組みを通じて、より多くの人々が民主主義のプロセスに参加し、社会の意思決定に貢献できるようになるだろう。
マスコミュニケーションの双方向化は、フィードバックループを繰り返すことで徐々に実現に近づいていく。
雪玉が転がりながら大きくなるように、こうした取り組みが積み重なることで、より良い社会の実現につながることを期待したい。
余談: 余裕があったら書く
KJ法とのアナロジー
https://gyazo.com/973ea9617662cabdccfcf594eff6bb7c
自分の心のなかに、「これだけの紙きれの資料は、自分の考えによれば、内容的に市場調査・品質管理・労務管理と三つに大きく仕切るのが正しい」などというたぐいの、グループ分けについての独断的な原理をあらかじめ頭の中にもっているからである。その独断的な分類のワクぐみを適用し、そのできあいのワクの中にたんに紙きれの資料をふるい分けて、はめこんでいるにすぎないのである。これでは KJ法の発想的意義はまったく死んでしま う。
川喜田二郎は人間が独断的な分類のワクぐみへのふるい分け、はめこみをすることを批判した その対処法として1枚1枚をみて関連するものとくっつけるKJ法を提案した TTTCでは、人間ではなく機械がクラスタリングを実行することで「人間が独断的な分類へのはめこみをしてしまうこと」が避けられている
KJ法の効用の一部を手軽に得られる方法だと思う
KJ法を丸ごと置き換えるか?
そうではないという肌感
目下のところ「近さ」は「埋め込みベクトル空間のコサイン距離」になっている
ここが人間のKJ法との違いなのではないかと思っているが、実は違っていなくて人間も同様の処理をしているかもしれない
同一のデータに対して人間がKJ法をやったのとTTTCをやったのを比較するともっと言語化されると思う、今後の研究
https://gyazo.com/4af6ff261bf5d9399b1a3158120c28c6
1: 枠の中にこもっている
2: 枠の外を見る
3: 外からの視点によって元々持っていた枠が薄れていく
4: 外からの視点が集まることによって「いくつもの視点から見た理解」が生まれる
TTTCは人々をレベル3~4へ移行させることを促すシステムと言えそう